Validation d'une méthodologie pour l'étude des marqueurs de la segmentation dans un grand corpus de textes

نویسندگان

  • Sophie Piérard
  • Yves Bestgen
چکیده

This research aims at validating a methodology for the study of segmentation markers in large corpora. Two indices signalling a thematic break in a text are proposed. The first is based on the presence of a paragraph mark and employs the odds ratio to identify the best markers. The second takes into account lexical cohesion between sentences via an index resulting from latent semantic analysis. These two indices were applied mainly to the study of temporal adverbial expressions in literary texts. The analyses carried out confirm a series of linguistic hypotheses about the segmentation function of temporal adverbials. MOTS-CLÉS : marqueurs de segmentation, adverbiaux temporels, paragraphe, analyse sémantique latente, expressions référentielles.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Marqueurs de la relation cause-effet : stabilité et variation dans des corpus de nature différente

Résumé : Les marqueurs lexicaux figurent parmi les indicateurs les plus intéressants pour identifier et classer finement des relations terminologiques. Cependant, l’exploitation des marqueurs pour repérer automatiquement ou semi-automatiquement les relations dans des corpus, notamment des corpus associés à des domaines ou à des genres textuels différents, peut soulever des problèmes. Le présent...

متن کامل

Un système de vote pour la classification de textes d'opinion

La classification de textes a pour objectif le regroupement de documents selon différents critères. Dans les travaux présentés dans cet article, nous nous intéressons à la classification de textes d'opinion qui consiste à classer les textes selon un jugement tel que l'aspect positif ou négatif d'une critique, l'aspect favorable ou défavorable donné par un expert, etc. Nous proposons dans cet ar...

متن کامل

فایل کامل مجلّه مطالعات زبان فرانسه دو فصلنامه علمی پژوهشی زبان فرانسه دانشکده زبانهای خارجی دانشگاه اصفهان

Tâ ÇÉÅ wx W|xâ Revue des Études de la Langue Française Revue semestrielle de la Faculté des Langues Étrangères de l'Université d'Ispahan Cinquième année, N° 8 Printemps-Eté 2013, ISSN 2008- 6571 ISSN électronique 2322-469X Cette revue est indexée dans: Ulrichsweb: global serials directory http://ulrichsweb.serialssolutions.com Doaj: Directory of Open Access Journals http://www.doaj.org ...

متن کامل

Reconnaissance automatique de concepts à partir d'une ontologie

Résumé Ce papier présente une approche qui s’appuie sur une ontologie pour reconnaître automatiquement des concepts spécifiques à un domaine dans un corpus en langue naturelle. La solution proposée est non-supervisée et peut s’appliquer à tout domaine pour lequel une ontologie a été déjà construite. Un corpus du domaine est utilisé dans lequel les concepts seront reconnus. Dans une première pha...

متن کامل

Construction d'une ontologie du domaine HSE

Résumé : Dans cet article, nous présentons un travail de construction d’une ontologie du domaine de la réglementation Hygiène-Sécurité-Environnement (HSE) concernant les installations industrielles. Ce travail a été mené selon deux approches : l’utilisation de nomenclatures et d’interviews d’experts du domaine pour aider à la compréhension des notions du domaine et à leur conceptualisation et l...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • TAL

دوره 47  شماره 

صفحات  -

تاریخ انتشار 2006